【问题描述】
在聚集查询时,能否将字符类型字段按照实际内容进行分组去重呢?
示例:

  1. 插入数据包含字符串

db.cs.cl.insert( { a : {“20190101000000” }} )
db.cs.cl.insert( { a : {“20190101111111” }} )
db.cs.cl.insert( { a : {“20190103000000” }} )

  1. 执行 aggregate 查询,能否实现将字符串格式按照 20190301 这一段内容 进行分组去重?

【解决办法】

  1. SequoiaDB aggregate 函数目前不支持将字符串的某段内容进行分组,只支持对整个字符串进行分组去重
  2. 从客户的问题来看,客户是想将字符串格式的时间戳转成时间内容来进行分组,最便捷的方法是通过 SQL 语法去实现
  3. 针对客户的问题,可以利用 SequoiaSQL-MySQL/SequoiaSQL-PostgreSQL + SequoiaDB 工具,使用标准 SQL 语句实现将字符串格式的时间戳转成日期内容进行分组去重,示例如下:
    1) 使用 SQL 语句建表:
    mysql> create table t1 ( a char(16) ) ;
    2) 插入数据
    mysql> insert into t1 values ( "20190101000000" );
    mysql> insert into t1 values ( "20190101111111" );
    mysql> insert into t1 values ( "20190103000000" );
    3) 使用 SQL 语句将字符串格式转成日期内容进行分组去重
    mysql> select count( a), date_format( a. '%Y-%m-%d' ) a from t1 group by date_format( a, '%Y-%m-%d' );
    4) 步骤3查询结果如下:
    count ( a ) a
    2 2019-01-01
    1 2019-01-03
  4. 如果字符串内容非时间戳格式,则无法转成日期内容进行分组去重

RaymondRMork
1 声望2 粉丝